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摘要 : [目的 /意义 ] 施 引文 献 与 被 引文 献 往往 存在 着 菜 种 相似 性 ,揭示 这 种 现象 背后 的 形成 机 制 有 助 于 深 
入 理解 引文 的 本 质 。 [ 方法“ 过程] 采用 指数 随机 图 模型 ,以 图 书馆 与 情报 学 领域 为 对 象 开展 实 证 分 析 , 旨 在 揭 
示 文 献 相似 性 对 引用 关系 的 影响 机 制 。[ 结果 /结论 ] 实证 研究 发 现 :在 网 络 结构 \ 机 构 、 期 刊 层面 存在 显著 的 引 
用 文献 相似 倾向 。 具 体 地 ,引用 关系 更 倾向 于 谈 入 三 角 传 递 结构 ;来 源 于 相同 机 构 和 期 刊 的 文献 之 间 更 容易 产 
生 引 用 关系 ;来 源 于 学 科 优 势 地 位 国家 的 文献 之 间 更 容易 产生 引用 。 实 证 结果 充分 说 明 社 会 接近 性 是 引用 行 


为 的 重要 形成 机 制 , 反 映 了 引用 偏好 的 社会 属性 。 
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CO 在 现代 科学 发 展 中 ,规范 化 的 文献 引用 扮演 了 重 
要 能 色 ,也 激发 了 学 者 们 研究 其 内 涵 及 机 理 的 兴 
拱 基 值得 关注 的 是 引文 已 经 成 为 现代 学 术 评 价 的 重要 
理 浴 基石 和 度量 工具 ,以 期 刊 影响 因子 h 指数 为 代表 
的 评价 工具 都 离 不 开 引 文 。 不 可 忽视 的 问题 是 :建立 
在 吉文 基础 上 的 评价 理论 和 工具 都 实质 上 隐 含 了 一 个 
关键 而 理想 化 的 前 提 , 即 引用 对 象 的 选择 是 完全 基于 
学 均 价 值 判断 或 某 种 学 术 目 的 的 。 显 然 ,严格 的 前 提 
假 骏 与 实际 应 用 之 间 存 在 较 大 差距 ,实践 中 出 现 的 各 
种 刍议 和 学 界 的 争论 都 反映 了 引文 内 涵 的 复杂 性 "1!。 
因此 ,非常 有 必要 追溯 到 问题 的 本 源 ,探究 引用 形成 的 
机 制 , 对 引文 价值 的 准确 理解 可 能 有 助 于 提出 或 修正 
更 具 学 术 价值 甄别 效能 的 引文 评价 指标 。 

考虑 到 引用 本 质 上 是 文献 间 的 二 元 关系 ,因此 施 
引文 献 与 被 引文 献 之 间 的 相似 性 可 能 是 考察 引用 内 在 
机 制 的 有 效 视角 和 途径 。 这 种 相似 性 可 能 表现 出 多 种 
不 同形 式 ,例如 ,在 文献 作者 层面 的 相似 特征 。 如 学 术 


La 


偶然 现象 ,这 种 所 谓 的 学 术 圈 子 正 是 某 种 社会 接近 性 
的 体现 。 有 学 者 提出 “精英 俱乐部 "指数" ,以 引用 关 
系 为 线索 ,从 统计 的 角度 识别 出 这 些 相互 高 度 认 同 的 
学 者 群体 。 

自 引 可 以 被 视 为 一 种 独特 引用 现象 , 即 施 引文 献 
与 被 引文 献 来 源 于 完全 相同 的 作者 。 和 针对 自 引 现象 的 
研究 非常 丰富 ,尤其 聚焦 于 它 对 科学 评价 产生 的 公平 
性 和 适用 性 问题 ”。 一 方面 ,有 学 者 认为 不 受 控 制 的 
自 引 数量 会 扭曲 合理 正常 的 引文 分 布 ,包含 自 引 的 评 
价 指标 的 公正 性 受到 质疑 ; 另 一 方面 ,也 有 学 者 认为 
针对 自 引 情形 需要 具体 分 析 , 当 样 本 足够 大 时 没有 必 
要 剔除 自 引 ,甚至 有 问卷 调研 发 现 科 研 人 员 在 进行 自 
引 和 他 引 时 并 不 存在 显著 差异 的 动机 。 

伴随 引用 关系 出 现 的 文献 相似 性 倾向 可 能 表现 在 
多 个 层面 ,除了 文献 作者 之 外 ,国家 或 地 区 .语言 # 
刊 . 机 构 可 能 都 存在 类 似 的 引用 偏好 倾向 。 例 如 A. 
Bookstein 和 M.，Yitzhaki'" 设计 了 母语 偏好 指标 来 研究 
相同 语言 群体 间 的 引用 倾向 ,说 明了 语言 偏好 性 对 引 


界 早 已 发 现 学 科 中 常 存在 某 个 高 频率 相互 引用 的 核心 
圈子 ,活路 在 其 中 的 作者 往往 都 是 领域 中 的 高 影响 力 
学 者 ”。 引 用 关系 聚集 在 特定 核心 学 者 群体 中 并 不 是 


用 行为 的 影响 。S. Ren 和 R. Rousseau 8] 从 期 刊 引用 
的 角度 开展 实证 研究 ,发 现 中 国 期 刊 之 间 的 高 比例 互 
引 现 象 ; 唐 莉 等 ”分 析 了 中 国 科研 成 果 高 速 增长 背后 
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存在 的 “俱乐部 效应 ” ,通过 中 美 对 比分 析 说 明 高 被 引 
论文 中 中 国 作者 内 部 存在 更 为 显著 的 互 引 行为 。 类 似 
现象 的 广泛 存在 很 大 程度 上 暗示 了 社会 属性 对 于 引用 
偏好 的 重要 影响 性 ,因此 从 更 广义 的 社会 接近 性 视角 
探讨 施 引 文献 和 被 引文 献 在 某 些 属性 上 表现 出 的 相似 
或 接近 倾向 ,能 有 助 于 更 系统 地 揭示 引用 偏好 的 形成 
机 制 。 

引用 关系 中 出 现 的 文献 趋同 现象 虽然 已 引起 部 分 
学 者 关注 ,但 研究 文献 较为 零散 而 不 够 系统 ,而 且 学 术 
界 对 其 背后 的 机 制 探讨 与 理论 分 析 不 够 深入 ""”。 通 
过 梳理 相关 文献 ,发 现 这 些 研 究 存在 以 下 不 足 :人 理论 
探讨 较 多 ,实证 分 析 匮 乏 ,尤其 是 缺乏 充分 利用 文献 大 
数据 的 建 模 分 析 ;@ 引 用 过 程 中 文献 趋同 性 是 具有 多 
维 表现 的 ,但 已 有 文献 大 多 只 是 聚焦 于 单个 维度 ,缺乏 
统 之 分 析 框 架 下 的 系统 性 讨论 ;@ 大 多 采用 描述 性 分 
棉 Y 缺 乏 统计 推断 的 分 析 , 难 以 判定 文献 相似 性 到 底 在 
得 度 上 影响 了 引用 偏好 的 形成 。 
己 由 此 ,引出 本 文 所 关注 的 基本 问题 :伴随 引用 关系 
这 献 相似 性 普遍 存在 吗 ” 它 们 在 多 大 程度 上 影响 了 
引 册 关系 的 形成 ? 通过 实证 结果 分 析 ,探究 外 部 社会 
因 水 在 学 术 引 用 过 程 中 的 影响 ,对 这 些 问 题 的 深入 思 
元 得 助 于 完善 对 于 科学 引文 本 质 的 理解 。 
“因此 ,以 社会 建构 理论 为 指导 ,提出 不 同 层面 下 引 
用 每 为 中 文献 相似 性 倾向 的 研究 假设 ;以 图 书馆 与 情 
报 学 领域 为 实证 学 科 领 域 ,采用 指数 随机 图 模型 ,以 引 
用 活 系 为 因 变量 ,将 引用 关系 形成 的 概率 建 模 为 有 关 
文 栈 相似 性 指标 变量 ;最 终 通过 实证 结果 分 析 ,探讨 
用 唆 成 的 基本 机 制 。 


2， 研究 方法 


2.1 指数 随机 图 模型 

随机 指数 图 模型 (ERGM ) 是 一 种 针对 网 络 二 元 关 
系 构建 的 计量 分 析 模 型 ,也 被 称 为 P" 模型 ,已 经 成 为 
一 种 重要 而 应 用 广泛 的 针对 网 络 边 的 建 模 方 法 ,可 以 
用 来 刻画 不 同 因 素 对 网 络 二 元 关系 形成 的 影响 。 模 型 
将 观察 到 事实 网 络 y 的 概率 建 模 为 各 种 可 能 构 型 
(configuration) ,例如 边 数 、 三 角形 、 互 惠 性 等 ,以 及 节 
点 属性 和 边 属性 。ERGM 模型 定义 … 的 形式 如 公式 


(1) 所 示 ; 
p(y=71) = SE 公式 (1) 


其 中 了 是 随机 关系 的 集合 ,可 以 用 随机 邻接 矩阵 
,表示 ,第 i 行 j 列 的 元 素 对 应 于 从 第 i 节点 到 第 j 节 
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点 的 关系 ;y 是 随机 邻接 矩阵 Y 的 一 个 实现 ,是 特定 的 
观察 到 的 关系 。X 是 与 边 或 节点 有 关 的 协 变 量 组 成 的 
向 量 。9 是 系数 向 量 ,是 各 种 变量 前 的 相应 系数 。g 
(y, XX) 是 由 网 络 变 量 构 成 的 向 量 , 如 果菜 构 型 在 网 络 
y 中 被 观察 到 次 , 则 g(y) =k。x(9,y) 是 归 一 化 因 
子 ,以 确保 所 有 可 能 网 络 样本 出 现 的 概率 和 为 1, 即 并 
exp|0'g(z,X)| =1。 

为 了 进一步 说 明 参 数 9 的 解释 外 
计量 5, 如 公式 (2) 所 示 : 

6.(y);=g8(Y; -8g(ys ) 公式 (2) 

其 中 y, 代 表 节 点 i 与 j 的 二 元 关系 ,1 代表 i 与 j 存 
在 连接 关系 ,否则 为 0。y; 和 y; 分 别 代 表 在 y 的 其 余 
部 分 保持 不 变 的 情形 下 ,分别 设 定 y;=1 或 y;=0 的 网 
络 实现 。 也 就 是 说 6,(y) ;反映 了 当 y; 由 0 变 为 1 而且 
其 他 边 保 持 不 变 的 条 件 下 ,网 络 统 计量 g(y) 的 变化 
量 。 利 用 变化 统计 量 , 可 以 将 公式 (1) 等 价 地 转化 为 
另 一 种 形式 ,如 公式 (3 ) 所 示 : 

logit[ P,,(Y;=11Y; =y;)] =06,(7) 公式 (3) 
其 中 函数 logit 代表 对 数 几率 ,定义 为 logit(p) = 
log[Lp/A(1 -p)],P 为 二 元 关系 发 生 的 概率 ,代表 除 
了 网 络 边 7 之 外 的 网 络 了 的 其 余部 分 。 公 式 左 边 代 
表 了 网 络 其 余部 分 不 变 的 情形 下 节点 i 和 j 建立 连 
接 的 对 数 几 率 。 公 式 右边 代表 了 ,固定 网 络 其 余部 分 
不 变 , 当 六 由 0 变 为 1 时 ,网 络 统计 量 g(y,) 每 增加 1 
个 单位 , 则 i 和 j 建立 连接 的 概率 是 不 建立 连接 概率 的 
exp(9) 倍 。 人 参数 9 的 大 小 反映 了 各 种 因素 对 网 络 边关 
系 的 边际 效应 。 

采用 指数 随机 图 模型 进行 建 模 分 析 , 主要 考虑 以 
下 两 点 :文献 通过 引用 关系 相互 连接 ,形成 引用 网 
络 , 专 门 针对 网 络 二 元 关系 建 模 的 指数 随机 图 模型 非 
党 适用 于 网 络 样本 ;@) 指 数 随 机 图 模型 比 传统 回归 模 
型 更 适合 于 网 络 关系 建 模 , 充 分 考虑 了 网 络 边关 系 存 
在 的 自 相关 性 ,满足 了 网 络 建 模 的 要 求 ;@ 指 数 随 机 图 
模型 能 够 将 引用 二 元 关系 发 生 的 概率 解释 为 引用 网 络 
内 生 构 型 和 外 生 协 变量 的 函数 ,将 各 种 相似 性 变量 加 
人 模型 ,其 统计 推断 功能 有 助 于 识别 出 不 同形 式 文献 
相似 性 对 引用 关系 的 影响 程度 。 
2.2 研究 假设 

从 引用 网 络 形成 的 角度 看 ,影响 每 个 引用 关系 的 
因素 可 以 大 致 划分 为 两 类 :中 各 个 引用 关系 存在 着 相 
互 的 影响 ,由 于 网 络 边 自 相关 性 带 来 的 内 生性 结构 因 
素 是 需要 考虑 的 内 容 ;@) 源 于 网 络 节点 或 边 的 外 生性 


E 力 ,引入 变化 统 
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辕 性 也 需要 关注 的 要 素 。 

2.2.1 内 生性 结构 趋同 倾向 引用 关系 内 舱 于 文献 
网 络 之 中 ,从 网 络 视角 开展 探讨 有 助 于 更 深入 地 揭示 
引用 行为 的 复杂 性 与 多 元 特征 。 网 络 系统 中 各 条 边 并 
非 独 立 存 在 的 ,而 是 相互 依赖 与 影响 ,因而 在 拓扑 上 可 
能 出 现 某 种 稳定 的 结构 。 从 网 络 形成 的 机 制 角度 看 ， 
网 络 边 建立 过 程 可 能 受到 这 种 内 生性 影响 而 产生 某 种 
连接 倾向 ,以 更 大 的 概率 形成 某 种 连接 关系 以 获取 某 
种 网 络 优势 ,能 入 结构 模式 之 中 的 节点 也 受益 于 网 络 
效应 。 结 构 特 征 是 社会 网 络 分 析 所 关注 的 方面 ,它们 


施 引 文献 与 被 引文 献 表 现 出 的 非 学 术 关 联 现象 提供 了 
解释 ,从 更 为 广泛 的 社会 关系 开展 探讨 有 助 于 理解 引 
文 的 复杂 性 。 

如 果 说 施 引 文献 与 被 引文 献 之 间 的 某 种 社会 关系 
不 是 偶然 出 现 的 ,而 是 与 引用 关系 共生 , 则 它们 两 者 之 
间 可 能 存在 着 某 种 不 可 忽视 的 内 在 联系 ,如 果 能 够 准 
确 地 揭示 两 者 之 间 的 依赖 ,必然 有 助 于 更 加 全 面 地 认 
知 引 用 的 内 在 本 质 。 从 知识 流动 的 角度 看 ,新 的 知识 
或 观点 更 容易 流向 吸收 或 接收 能 力 强 的 文献 节点 , 符 
入 相近 知识 社会 网 络 的 观点 更 容易 被 接纳 。 两 篇 文献 


可 能 体现 在 网 络 系统 的 不 同 尺度 层 面 ,例如 宏观 层面 
的 聚 类 中 观 尺度 的 社区 ,而 在 微观 层面 上 最 为 简单 而 
基本 的 结构 便 是 三 角 结构 。 简 单 地 说 ,以 经 典 的 朋友 
网 络 为 例 , 所 谓 的 朋友 的 朋友 可 能 也 是 朋友 ” 则 正 反 


映 李 这 种 基本 三 元 结构 ,在 期 刊 引证 网 络 '”、 合 作 网 
绒 汪 为 代表 的 实际 网 络 中 都 证 实 了 这 种 连接 模式 的 
存在 性。 

己 引 用 网 络 是 有 向 网 络 , 传 递 三 角 结构 是 其 中 一 种 
基 春 结构 。 一 般 地 ,如 果 文献 i 引用 文献 ,文献 j 又 引 
用 3D, 则 文献 i 也 会 引用 文献 5。 诬 入 传递 三 角 结 构 
文献 i 和 文献 之 间 存在 着 宛 余 路 径 ,除了 直接 
连 搂 还 有 1 条 长 度 为 2 的 间接 路 径 连接 。 从 知识 流 的 
销 度 ,文献 在 文献 和 之 间 扮 演 着 知识 中 介 者 的 角 
色 2 它 吸收 一 方 的 知识 ,并 将 增值 后 的 知识 再 传递 给 另 
-5 浙 , 第 三 方 文献 共享 机 制 为 两 文献 提供 了 潜在 的 知 
识 冉 移 渠道 ,避免 了 新 建 知识 流动 渠道 所 增加 的 成 本 
和 风险 。 因 此 , 非 直接 连接 的 文献 共享 相同 的 知识 , 它 
们 本 间 存在 建立 直接 连接 关系 的 倾向 ,形成 传递 三 角 


如 果 在 各 个 社会 属性 方面 越 接 近 , 则 它们 更 容易 建立 
显 性 的 引用 关系 。 

如 果 将 科学 文献 视 为 知识 生产 的 最 终结 果 , 则 知 
识 生产 系统 中 包含 与 涉及 的 有 关 要 素 都 是 不 可 缺少 
的 ,创新 主体 是 知识 的 生产 ,传播 与 吸收 者 ,知识 传播 
离 不 开 有 形 的 承载 客体 ,知识 流动 与 溢出 受到 空间 及 
组 织 的 边界 约束 。 依 据 社会 建构 理论 ,引文 不 但 是 无 
形 知识 相互 影响 和 碰撞 的 体现 ,更 是 环境 要 素 交 织 
用 的 结果 ;除了 心理 .智力 、 知 识 因素 ,引用 偏好 形成 与 
知识 流动 方向 还 应 该 是 社会 因素 的 结果 。 因 此 ,科学 
文献 相似 倾向 可 能 表现 在 以 下 多 个 方面 : 

(1) 文 献 载体 的 同 配 。 作 为 学 术 知 识 载 体 ,每 个 
期 刊 往往 体现 出 了 鲜明 的 学 科 领 域 . 选 题 内 容 方面 的 
个 性 标准 与 偏好 ,意味 着 相同 期 刊 上 的 文献 具有 更 相 
似 的 知识 结构 ,而 刊载 于 不 同期 刊 的 文献 则 相反 。 引 
文 根 本 上 是 知识 交流 与 衍生 的 外 在 表象 ,而 同 质 化 
的 知识 更 容易 被 吸收 和 理解 。 当 然 除 此 之 外 ,也 可 能 
存在 由 于 追求 期 刊 影响 因子 而 导致 的 出 版 商 和 投稿 者 
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结构 。 从 知识 流动 的 效率 看 , 见 余 路 径 结构 提供 了 更 
为 高 效 的 知识 传播 体系 ,降低 了 由 于 系统 结构 层面 的 
脆弱 性 导致 的 知识 传递 链 断 裂 风 险 ,具有 更 高 的 知识 
传递 网 络 鲁 棒 性 。 传 递 三 角 结 构 角 入 性 反映 科学 文献 
在 引用 网 络 微观 层面 的 结构 趋同 倾向 。 因 此 ,在 社会 
网 络 理论 的 基础 上 提出 研究 假设 : 

假设 1: 科 学 引用 关系 倾向 于 舱 入 传递 三 角 结 构 。 
2.2.2 外 生性 趋同 借 向 “科学 引用 形成 机 制 的 指导 
理论 中 ,社会 建构 理论 获得 了 广泛 的 关注 。 它 认为 引 
用 行为 的 产生 更 多 地 是 一 个 社会 的 过 程 , 受 到 了 外 部 
政治 \ 经 济 等 社会 要 素 的 多 重 作用 和 影响 ,产生 引用 关 
系 的 驱动 因素 并 不 局 限于 纯粹 的 学 术 范 畴 ,而 是 具有 
更 为 复杂 和 多 元 的 社会 属性 。 例 如 ,L，Bommann 和 
H. Daniel 系统 梳理 关于 引用 动机 的 研究 ,着 重 强调 了 
非 学 术 因素 在 科学 引用 生成 中 的 影响 “ 。 该 理论 为 


间 形 成 的 不 当 过 度 自 引 ,虽然 这 样 的 情形 可 能 是 个 案 ， 
但 也 不 可 和 忽视。 基于 此 ,本 研究 提出 假设 : 

假设 2: 相 同期 刊 的 文献 更 容易 发 生 引 用 关系 。 

(2) 正 式 组 织 的 同 配 。 科 学 研究 早已 成 为 职业 ， 
科研 人 员 隶 属于 某 个 学 术 单 位 ,这 些 单位 内 部 的 创新 
主体 自然 形成 了 长 期 而 稳定 的 学 术 关 系 。 相 同 的 学 术 
单位 意味 着 学 术 关 系 的 谍 入 ,这 种 相互 依赖 性 体现 了 
体制 ,制度 .组 织 层 面 的 安排 与 保障 。 社 会 网 络 强 关 系 
不 但 是 显 性 知识 传递 的 路 径 ,长 期 合作 与 面对面 交流 
更 为 隐 性 知识 溢出 提供 了 渠道 。 基 于 此 ,本 研究 提出 
假设 : 

假设 3: 源 于 相同 作者 单位 的 文献 更 容易 发 生 引 
关系 。 

(3) 非 正式 组 织 的 同 配 。 当 今 科学 研究 协作 与 交 
流 趋势 日 益 明显 ,互联 网 与 社交 媒体 的 发 达 更 是 促进 


>, 
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跨 组 织 .路 国家 的 科学 发 展 ， 无 形 学 院 " 开始 成 为 与 
正式 学 术 组 织 互 补 的 科研 新 模式 。 学 者 们 形成 的 群 
体 、 社 区 、 圈 子 是 一 种 松散 的 耦合 创新 系统 ,共同 或 者 
相似 的 领域 .兴趣 任务 甚至 目标 是 各 种 非 正 式 组 织 形 
成 的 基础 。 创 新 主体 自发 形成 的 非 正式 组 织 及 和 群 
体 已 经 成 为 学 者 们 获取 新 知识 .拓展 社会 关系 的 重要 
渠道 ,外 部 社会 网 络 的 连接 与 舱 入 可 能 会 为 学 者 带 来 
额外 的 异 质 知识 、 学 术 资 源 、 声 望 与 优势 。 基 于 此 ,本 
研究 提出 假设 : 

假设 4: 作 者 源 于 相同 非 正 式 组 织 的 文献 更 容易 
发 生 引用 关系 。 
(4) 地 理 空间 的 同 配 。 新 经 济 地 理学 对 于 经 济 资 
源 的 集聚 现象 开展 了 深入 研究 ,而 作为 内 生发 展 动力 
的 科技 创新 也 呈现 类 似 的 特征 。 学 术 界 普遍 认为 创新 


主体 在 地 理 空 


间 的 集聚 有 利于 知识 的 溢出 ,这 种 外 部 


效应 促进 了 创新 活动 的 效率 和 效果 。 除 了 知识 涪 
出 的 观点 之 外 ,可 能 还 隐 含 着 其 他 社会 性 因素 的 可 能 
解释 ,例如 接近 的 地 理 空 间 往往 意味 着 创新 主体 在 本 
地 社会 环境 的 伐 入 ,包括 国家 政治 .法律 制度 .语言 文 
化 等 。 这 些 同 质 化 的 外 部 社会 结构 为 创新 主体 间 的 认 


知 与 认同 提供 


了 基础 ,提高 了 学 术 交 流 的 效果 。 基 于 


此 ,本 研究 提出 假设 : 


假设 5: 来 源 于 相近 地 理 空 


引用 关系 。 


2.3 模型 设 定 与 变量 选取 


间 的 文献 更 容易 发 生 


表 1 给 出 了 本 文 模型 中 需要 用 到 的 有 关 构 型 变量 


内 涵 及 其 统计 量 定义 ,下面 结合 


表 1 指数 随机 数 图 模型 网 络 统计 量 含 义 


具体 变量 加 以 说 明 。 


含义 图 例 统计 量 假设 
边 数 1 CO/ ys 模型 常数 项 ,等 价 于 网 络 密度 
了 \ Gh | 
传递 三 角 结 构 A 引用 关系 是 否 倾向 于 形成 闭合 模式 ? 
Ak 
Nodematch ( 8) 节点 同 质 性 i1@®@ 6) 是 否 具有 相同 8 属性 的 文献 更 倾向 于 发 生 引 用 关系 ? 
EU Nodeicov(8) 节点 协 变量 ‘OiO—o®@ 六 六 是 否 8 属性 强 的 文献 更 倾向 于 被 引用 ? 


.二 (1 ) 内 生性 结构 趋同 变量 。 针 对 有 向 引用 网 络 ， 
传递 三 角 结构 作为 一 种 网 络 构 型 体现 了 引用 关系 间 的 
相生 依赖 性 。 变 量 Tiriple 定义 为 引用 网 络 中 传递 三 角 
结 权 的 个 数 ,如 表 1 所 示 。 如 果 变量 Tiriple 前 系数 显 
著 的 正 , 则 说 明 相 比 其 他 随机 结构 ,引用 关系 更 倾向 于 
嵌入 传递 三 角 结构 之 中 ,数值 越 大 这 种 倾向 性 越 大 , 否 
则 相反 。 

(2) 外 生性 趋同 变量 。 本 文 探讨 4 方面 的 外 生性 
趋同 倾向 , 即 文献 载体 的 同 配 、 正 式 组 织 的 同 配 、 非 正 
式 组 织 的 同 配 地理 空间 的 同 配 。 如 表 1 中 所 示 , 如 果 
节点 宇和 节点 / 具有 相同 的 分 类 属性 8, 则 记 为 1, 否则 
为 0; 那 么 Nodematch(8) 统 计量 代表 了 网 络 中 相同 属 
性 5 的 二 元 组 (i, 让) 数量 , 即 反映 了 网 络 中 节点 在 属性 
5 上 的 匹配 程度 。 


正式 组 织 的 同 配 通过 科学 文献 作者 所 属 机 构 的 匹 


配 关 系 加 以 刻画 。 变 量 Nodemaich( J0) 定 义 为 具有 相 


同 作者 机 构 的 所 有 施 引文 献 与 被 引文 献 组 合 的 数量 。 
考虑 到 科学 文献 可 能 存在 一 篇 文献 有 多 名 作者 而 每 名 
作者 归属 于 多 个 机 构 的 情形 ,两 篇 文献 只 要 至 少 拥 有 


1 个 相同 的 作者 机 构 ,就 认为 归 


属 机 构 相 同 。 该 变量 


前 的 系数 如 果 显 著 为 正 ,说 明 来 源 于 相同 作者 机 构 的 


文献 更 倾向 于 产生 引用 


关系 ,系数 数值 越 大 ,这 种 边际 


效应 越 强烈 ,否则 相反 
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非 正 式 组 织 的 同 配 可 以 通过 科学 文献 作者 是 否 同 


样 成 为 高 被 引 作 者 加 以 刻画 。 
式 , 这 里 界定 为 学 科 领 域 的 高 被 
在 学 科 领 域 中 具有 高 的 学 术 影 


FE 正式 组 织 具有 多 种 形 
引 作者 ,这 个 群体 通常 
响 力 和 声望 ,是 学 科 前 


沿 的 引领 者 。 具 体 地 ,本 文 将 学 科 领 域 中 累积 被 引 数 


文献 载体 的 同 配 关系 定义 为 施 引 文献 与 被 引文 献 

是 否 发 表 在 相同 的 期 刊 。 变 量 Nodematch( J0) 定 义 为 

来 源 于 相同 期 刊 的 所 有 施 引 文献 与 被 引文 献 组 合 的 数 

量 。 该 变量 前 的 系数 如 果 显 著 为 正 , 说 明 来 源 于 相同 

期 刊 的 文献 更 倾向 于 产生 引用 关系 ,系数 数值 越 大 ,这 
边际 效应 越 强 烈 ,否则 相反 。 
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前 1% 的 作者 界定 为 高 被 引 
(40) 定 义 为 施 引文 献 与 被 引文 


作者 。 变 量 nodematch 


献 组 合 的 数量 ,这些 文 


献 都 是 由 高 被 引 作者 所 署名 。 该 变量 前 的 系数 如 果 显 
著 为 正 , 说 明 引 用 关系 更 倾向 于 出 现在 高 被 引 作者 的 
文献 之 间 ,系数 数值 越 大 ,这 种 边际 效应 越 强烈 ,否则 


相反 。 
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段 庆 锋 ， 潘 小 换 . 文献 相似 性 对 科学 引用 偏好 的 影响 实证 研究 [可 j. 图书 情报 工作 ,2018 ,62(4) :97 - 106. 


地 理 的 同 配 通 过 文献 来 源 城 市 的 匹配 关系 加 以 刻 
画 。 本 文采 用 是 否 同属 相同 城市 来 间接 作为 地 理 同 配 
关系 的 代理 变量 ,虽然 不 如 城市 间 测 地 线 距离 精确 ,但 
简单 可 行 ,同样 可 以 满足 研究 需要 。 考 虑 到 科学 文献 
可 能 会 有 多 个 城市 地 址 ,如 果 2 篇 文献 至 少 拥有 1 个 
相同 的 来 源 城市 , 则 认定 为 来 源 于 相同 城市 。 变 量 
Nodematch( AU) 定 义 为 具有 相同 来 源 城市 的 施 引 文献 
与 被 引文 献 组 合 的 数量 。 该 变量 前 的 系数 如 果 显 著 为 
正 ,说 明 引 用 关系 更 倾向 于 出 现在 相同 来 源 城 市 的 文 
献 之 间 ,系数 数值 越 大 ,这 种 边际 效应 越 强烈 ,否则 相 
反 。 

(3 ) 控 制 变 量 。 模 型 加 入 了 代表 文献 学 术 水 平 的 
变量 -学术 价值 Nodeicov( C7) ,用 于 解释 学 术 价值 在 
引用 过 程 中 产生 的 作用 效果 。 本 质 上 ,引文 是 思想 与 
观 丰 的 交互 与 碰 檀 ,文献 的 思想 内 容 ,学 术 创新 性 对 引 
用 的 影响 是 至 关 重 要 的 。 变 量 Nodeicov( C7) 的 含义 如 
养 所 示 ,定义 为 被 引文 献 的 累积 被 引 数 ,其 中 CT 代 
表 英 献 的 累积 被 引 数 。 该 变量 用 于 检验 引用 网 络 中 被 
引用 文献 属性 C7 强 弱 对 于 连接 建立 概率 的 影响 。 

思 变 量 Edges 是 事实 引用 网 络 中 所 有 边 的 数量 , 反 


中 C 是 文献 d 的 所 有 前 向 引用 (forward citation ) 与 后 
向 引用 (backward citation) 构成 的 集合 ,如 果 Vece 忆 , 则 
将 文献 4 界定 为 引用 网 络 的 孤立 文献 。 依 据 上 述 方 
法 ,筛选 数据 ,最 终 得 到 2 125 条 文献 记录 数据 。 

模型 分 析 建 立 在 网 络 关系 基础 上 ,需要 从 文献 元 
数据 中 抽取 引用 关系 并 形成 矩阵 数据 。 将 科学 文献 视 
为 网 络 节 点 ,如 果 文 献 i 引用 文献 j, 则 形成 1 条 由 i 到 
的 有 向 边 。 网 络 和 矩阵 由 二 元 数值 构成 , 设 定 1 代表 存 
在 引用 关系 ,和 否则 为 0, 最终 形成 2 125 x2 125 的 引用 
关系 和 矩阵。 同时 还 抽取 了 每 篇 论文 的 其 他 有 关 元 数 
据 , 包 括 来 源 期 刊 .发表 时 间 、 被 引 数 、 作 者 、 机 构 、 国 
家 ,用 于 模型 中 外 生 协 变量 的 生成 。 
3.2 描述 性 分 析 

对 国家 、 机 构 .期刊 不 同 层面 的 描述 性 分 析 , 有 助 
于 初步 判断 引用 文献 相似 现象 的 分 布 规律 。 这 里 采用 
内 部 引用 率 来 刻画 引用 趋同 程度 ,指标 定义 为 : 源 于 相 
同 实体 (例如 国家 、 机 构 、 期 刊 ) 的 文献 相互 引用 数量 
占 其 施 引 总 量 的 比例 ,反映 了 引用 关系 中 文献 的 相似 
程度 。 如 果实 体内 部 引用 率 越 大 ,说 明 越 倾 向 于 选择 
源 于 相同 实体 的 文献 作为 引用 对 象 。 另 外 ,为 了 识别 


Rey 引用 发 生 的 总 量 。 该 项 属于 模型 的 必 选 ,相当 于 
传 锚 回归 模型 中 的 常数 项 ,解释 能 力 等 价 于 网 络 密度 ， 
该 恋 量 前 的 估计 系数 反映 了 网 络 密度 对 边 连 接 几率 影 
响 欧 边 际 效应 。 

>< 模 型 中 引入 变量 - 几何 加 权 二 元 关系 共享 组 合 
GWDSP ( geometrically weighted dyad -wise shared part- 
ng 陪 ,其 定义 为 所 有 可 能 共享 节点 二 元 项 分 布 的 加 权 
线 履 组 合 。 一 方面 变量 表征 了 网 络 中 形成 开放 三 角 结 
构 的 倾向 , 另 一 方面 也 有 助 于 降低 模型 发 生 退 化 的 风 


A 人 [18] 
My. O 


3 ”实证 分 析 


3.1 数据 来 源 及 处 理 


实体 在 学 科 中 的 影响 力 ,选取 被 引 量 为 指标 ,如 果实 体 
文献 积累 的 被 引 数 越 多 , 则 说 明 该 实体 具有 越 大 的 学 
影响 力 。 表 2 分 别 给 出 了 按 国家 和 机 构 统计 的 内 部 
引用 率 , 列 出 了 被 引 总 量 前 10 名 的 国家 和 机 构 情 况 。 
在 国家 方面 ,美国 的 表现 无 颖 一 校 独 秀 ,内 部 引用 
率 达 到 极 高 的 70% ,反映 了 美国 在 该 领域 处 于 绝对 的 
领先 地 位 ,它们 的 研究 基本 能 够 代表 领域 前 沿 水 平 ,从 
知识 流动 的 角度 看 形成 了 内 部 循环 发 展 的 学 科 生 态 。 
影响 力 前 5 名 的 其 他 国家 也 表现 出 了 较 高 的 内 部 引用 
率 ,分 布 在 区 间 (32% ,39% ) ;其 他 影响 力 前 15 名 的 国 
家 (除了 巴西 ) ,内 部 引用 率 都 保持 在 (10% ,20% ) 之 
间 ,其 中 中 国 的 文献 具有 19% 的 内 部 引用 率 ,与 整体 
分 布 规律 比较 吻合 ;值得 注意 的 是 巴西 419% 的 内 部 引 


以 图 书馆 与 情报 学 (LIS ) 为 研究 学 科 领 域 , 选 取 学 


用 率 明 显 高 出 了 其 他 同 水 平 国家 的 内 部 引用 倾向 ,与 


科 中 具有 代表 性 的 7 本 国际 性 期 刊 为 检索 范围 ,包括 : 
Journal of documentation .Scientometrics 、Journal of infor- 
mation science、 Electronic library、 Information technology 
and libraries Library & information research Journal of the 
American Society for Information Science。 所 有 数据 来 源 
于 WoS 数据 库 , 样 本 时 间 跨 度 为 1980 - 2010 年 ,文献 
类 型 筛选 为 Article ,得 到 初始 检索 数据 6 111 条 。 为 了 
便于 分 析 , 进 一 步 删 去 引用 网 络 中 的 孤立 文献 。 具 体 
地 ,假设 d 是 文献 集合 D 中 的 任意 一 篇 文献 ,ce C, 其 


其 影响 力 水 平 不 相符 合 的 异常 知识 流动 结构 可 能 反映 
了 该 国 研究 较为 封闭 的 特征 。 

机 构 方 面 ,被 引 总 量 前 15 名 的 机 构 大 多 拥有 较 高 
的 自 引 率 ,分 布 在 区 间 (20% ,50% ) 之 间 。 以 Leiden 
Univ .Drexel Univ 等 为 代表 的 高 校 或 研究 所 在 图 书馆 
与 情报 学 领域 拥有 雄厚 的 实力 ,内 部 引用 率 与 被 引 量 
两 个 指标 都 相对 较 高 。 值 得 注意 的 是 Inst Sci Informat 
的 内 部 引用 率 高 达 55% ,追逐 该 机 构 的 论文 可 以 发 
现 , 大 部 分 内 部 引用 论文 与 科学 计量 学 的 葛 基 人 物 H. 
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表 2， 按 国家 和 机 构 统计 的 内 部 引用 率 (被 引 总 量 前 10 名 的 国家 和 机 构 ) 


序号 国家 内 部 引用 率 ”被 引 总 量 (次 ) 机 构 内 部 引用 率 ”被 引 总 量 (次 ) 
1 USA 0.70 1 260 Leiden Univ 0.30 142 
2 England 0.38 380 Drexel Univ 0.47 126 
3 Netherlands 0.32 297 Katholieke Univ Leuven 0.35 109 
4 Belgium .37 238 NatlInst Sci Technol & Dev Studies 0.39 92 
5 Hungary 0.39 190 Indiana Univ 0.24 90 
6 India 0.14 111 Hungarian AcadSci 0.25 85 
7 Canada 0.14 97 Inst SciInformat 位 335 79 
8 Spain 0. 14 90 City Univ London 0. 35 71 
9 France 0.17 86 Wolverhampton Univ 0.31 66 
10 China 0.19 81 Hungarian AcadSci Lib 0.19 58 
11 Denmark 0.18 75 Univ Sheffield 0.28 52 
12 Sweden 0.17 65 Limburgs Univ Ctr 0.22 49 
13 Finland 0.11 60 Univ N Carolina 0.30 45 
14 Brazil 0.41 55 Univ Amsterdam 0.20 43 
2 15 Germany 0.14 50 Royal Sch Lib & Informat Sci 0.03 43 
和 下 ，Garfield 有 关 , 他 们 所 做 的 开创 性 研究 大 多 另外 ,在 国家 层面 ,内 部 被 引 率 与 被 引 数 量 呈 现 正 


成 为 当前 研究 的 思想 源泉 与 理论 基石 。 同 样 , 许 多 具 
项 误 内 部 引用 率 的 机 构 都 可 以 列 出 几 位 具有 高 影响 力 
代表 性 学 者 ,例如 Drexel Univ 有 知名 学 者 K. W. 
Meepin \H. D. White、K. W. McCain\B. C. Griffith, 而 
LANin Univ 有 知名 学 者 H. F. Moed.R. 本 W. Tijssen、 
AEEEJT. V， VanRaan。 科 研 机构 内 部 的 稳定 学 者 群体 具 
有 写 效 率 的 知识 共享 和 流动 便利 ,也 有 利于 形成 高 质 
量 水 平 的 科研 团队 ,也 是 导致 科研 机 构 出 现 较 高 的 内 
部 吉 用 倾向 的 原因 所 在 。 

守 由 表 2 的 数据 分 布 可 以 发 现 :不 论 是 国家 还 是 机 构 
层面 ,通过 被 引 数 刻画 的 实体 学 术 影响 力 与 其 内 部 引用 
率 包间 似乎 存在 某 种 相关 性 。 为 了 进一步 检验 这 种 关 
联 性 , 表 3 列 出 了 按 被 引 数 降序 排列 的 国家 和 机 构 内 部 
引用 率 分 布 。 例 如 ,被 引 量 前 1% 的 国家 和 机 构 的 平均 
内 部 引用 率 分 别 为 70% .34% ;被 引 量 前 50% 的 国家 和 
机 构 的 平均 内 部 引用 率 分 别 为 34% .18% ;所 有 国家 和 


相关 ,Spearman 秩 相 关系 数 为 0.785 ,通过 1% 显著 水 
平 的 双 侧 检验 ;在 机 构 层 面 , 内 部 被 引 率 与 被 引 数 量 呈 
现 正 相 关 ,Spearman 秩 相 关系 数 为 0.493 ,通过 195 显 
著 水 平 的 双 侧 检验 。 可 以 看 出 ,内 部 被 引 率 与 被 引 数 
存在 一 定 程 度 的 正 相 关 性 ,高 影响 力 的 国家 和 机 构 通 
常 表现 出 较 高 内 部 被 引 率 。 

表 4 给 出 了 期 刊 层 面 的 内 部 引用 率 分 布 。 总 体 
上 ,不 同期 刊 内 部 引用 率 指标 存在 较 大 的 差异 。Scien- 
tometrics Journal of the American Society for Information 
Science 具有 最 高 的 内 部 引用 率 , 而 且 不 论 是 被 引 数 还 
是 影响 因子 都 表现 出 明显 优势 ,反映 了 它们 在 学 科 
具有 较 高 影响 力 。 按 照 复杂 网 络 理论 中 “优先 连 
接 " 机 制 解释 ,与 其 他 期 刊 相 比 ,这 两 个 期 刊 具 有 高 
的 影响 因子 ,具有 更 大 的 优势 与 几率 被 其 他 文献 引 
目 。 其 他 期 刊 则 具有 较 低 的 内 部 引用 率 , 不 论 是 影 
因子 还 是 被 引 数 都 反映 了 它们 在 学 术 影 响 力 方面 


| 


本 


机 构 的 平均 内 部 引用 率 分 别 为 32% .15% 。 随 着 学 术 影 
响 力 下 降 , 内 部 引用 率 亦 呈 现 梯度 下 降 趋 势 。 
表 3 国家 和 机 构 内 部 引用 率 分 布 


内 部 引用 率 均值 
被 引用 总 量 累积 分 布 

国家 机 构 

前 1% 0.70 0.34 

前 10% 0.49 0.23 

前 25% 0.37 0.20 

前 50% 0.34 0.18 

前 75% 0.33 0. 16 

前 100% 0.32 0. 15 
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as 


f 逊 一 筹 。 
3.3 ERGM 模型 分 析 结 果 

模型 参数 9 的 大 小 与 显著 性 程度 是 分 析 各 种 构 型 
变量 对 二 元 因 变 量 影响 程度 的 依据 。 和 采用 R 环境 中 的 
STATNET 程序 包 进行 参数 估计 ,具体 采用 马尔 可 夫 链 
蒙特 卡 罗 极 大 似 然 估计 法 (MCMC MLE ) 对 模型 参数 进 
行 检验 估计 。 为 了 判断 参数 拟 合 的 效果 ,使 用 t 统 计 
量 进 行 参数 显著 性 的 检验 。 男 外 ,AIC 和 BIC 指标 可 
用 于 整体 模型 拟 合 效果 的 判断 依据 。 


Nop 


(~ NINAX 
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段 庆 锋 ， 潘 小 换 . 文献 相似 性 对 科学 引用 偏好 的 影响 实证 研究 [可 .图 书 情 报 工 作 ,2018 ,62(4) :97 -106. 


表 4 按期 刊 统计 的 内 部 引用 率 


序号 期 刊 内 部 引用 率 被 引 数 影响 因子 
1 SCIENTOMETRICS 0.82 2015 2.147 
2 JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE 0.74 946 2.322 
3 JOURNAL OF DOCUMENTATION 0.34 297 0. 853 
4 JOURNAL OF INFORMATION SCIENCE 0.26 257 1.372 
5 INFORMATION TECHNOLOGY AND LIBRARIES 0.68 72 1.029 
6 LIBRARY & INFORMATION SCIENCE RESEARCH 0.23 | 1 183 
芝 ELECTRONIC LIBRARY 0.45 53 0.484 


注 :影响 因子 来 源 于 2016 年 的 JCR 报告 

采用 逐步 加 入 变量 的 策略 对 模型 进行 设 定 和 选 
择 ,ERGM 模型 参数 估计 结果 如 表 5 所 示 。 模 型 1 只 
加 入 了 内 生性 影响 因素 ,而 模型 2 在 模型 1 的 基础 上 
又 加 入 了 外 生性 影响 因素 。 模 型 2 中 同 配 变量 Node- 
mach(AU) 没 有 通过 显著 性 检验 , 故 将 该 项 删 去 ,最 终 


形成 模型 3。 与 其 他 模型 相 比 ,模型 3 具有 最 小 的 AIC 
和 BIC 值 ,所 有 统计 量 参数 都 通过 了 0.1% 水 平 的 显著 
性 检验 ,说 明 模型 3 的 形式 设 定 是 合适 的 ,参数 拟 合 结 
果 也 是 满意 的 。 下 面 针对 模型 3 ,进行 分 析 和 人 解释。 


表 5 ERGM 模型 参数 估计 结果 


外 生性 趋同 
期 刊 Nodematch( J0) 


机 构 Nodematch( JG) 
高 被 引 作者 Nodematch (AU) 
国家 Nodematch( CY) 
边 数 Edges 
被 引 数 Nodeicov( CT) 
何 加 权 二 元 共享 组 合 GWDSP 
AIC 55 675 


一 7. 298(0. 053 ) *** 
0. 012(0. 001) ws* 


-0.131(0.018) *** 


BIC 55 729 


变量 及 指标 模型 1 模型 2 模型 3 
内 生性 结构 趋同 
传递 三 角 结 构 Ttriple 2. 076(0. 001 ) ** 1. 892(0. 001 ) *** 1.947(0.000) *** 


1.314(0.055) ™* 1. 285(0. 062) *** 


3.440(0.052) ™™ 3.537(0.157) ™** 
—0. 005 (0. 031) 
-1.123(0.068)™™ —0. 852(0. 094 ) *** 
一 7. 692(0. 034) 一 7.763(0. 074) ** 
0.006(0.001) ™™ 0.064(0.094) *** 
-0.115(0.010) ™™ —0.167(0.015) *** 
53 341 51 926 


53 347 52 020 


本 :括号 中 为 参数 估计 量 的 标准 差 ;、“、" 分 别 代表 p<0.001、p <0.01、p<0.05 


变量 Tiriple 的 系数 显著 为 正 ,说 明 在 网 络 其 他 部 
分 保持 不 变 条 件 下 ,引用 关系 艇 人 传递 三 角 结 构 中 的 


交流 ,而 相同 期 刊载 体 的 高 可 见 性 也 增加 了 被 引 的 机 
会 。 邱 均 平等 ”采用 调查 问卷 的 方法 ,探究 了 科研 人 


几率 是 其 他 情形 的 7( =。 ”) 倍 。 如 果 两 文献 存在 间 
接 的 引用 路 径 , 则 它们 之 间 更 倾向 于 建立 直接 引用 关 
系 ,体现 了 在 引用 网 络 结构 层面 的 趋同 倾向 。 进 一 步 ， 
正 向 效应 也 体现 了 引用 关系 形成 闭合 三 角 的 倾向 , 结 
构 中 各 条 边 之 间 存 在 相互 条 件 依赖 性 ,每 个 引用 关系 
是 般 入 网 络 环境 的 。 基 于 此 ,实证 结果 支持 假设 1 成 
立 。 

变量 Nodematch (J0) 的 系数 显著 为 正 ,说 明了 期 
刊 和 机 构 的 同 配 对 于 建立 引用 关系 具有 促进 作用 。 假 
定 引 用 网 络 其 他 条 件 不 变 , 源 于 相同 期 刊 的 文献 发 生 
引用 关系 的 几率 是 不 同期 刊 情形 的 3.61( =e ”) 售 。 
一 方面 ,相似 的 研究 领域 及 选 题 有 利于 观点 与 知识 的 


i 


员 论 文 引用 的 5 种 动机 心理 结构 与 因素 ,发 现 信 息 源 
便利 性 对 于 引用 动机 的 重要 作用 ,而 相同 期 刊 来 源 带 
来 的 高 可 见 性 很 大 程度 上 提高 了 信息 源 便利 性 。 男 一 
方面 ,按照 社会 建构 理论 ,在 出 版 过 程 中 作为 利益 相关 
方 的 投稿 作者 与 出 版 方 之 间 存 在 利益 交换 的 道德 风 
险 ,这 种 潜在 的 引用 暗示 或 默契 也 有 可 能 推 高 期 刊 内 
部 引用 比例 。 基 于 此 ,实证 结果 支持 假设 2 成 立 。 
变量 Nodematch (JG) 的 系数 显著 为 正 ,说 明了 机 
构 的 同 配对 于 建立 引用 关系 具有 促进 作用 。 假 定 引用 
网 络 其 他 条 件 不 变 , 如 果 两 篇 文献 具有 相同 的 机 构 , 则 
这 两 篇 文献 建立 引用 关系 的 几率 分 别 是 不 同 机 构 情形 
的 34.36( =e” ) 倍 。 值 得 注意 的 是 :机 构 同 配对 于 
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aa [下 甘 丰 开 || 
LnlInax1IV 辐 小 上 世 有 T | 


引用 关系 建立 的 影响 程度 非常 大 ,作用 方向 虽然 与 预 
期 一 致 ,但 机 构 同 配 的 影响 效应 超出 了 有 异 配 情形 的 34 
音 。 如 此 强烈 的 影响 效果 ,反映 了 社会 强 关 系 在 科学 
活动 中 的 重要 性 。 其 一 ,从 社会 网 络 的 角度 看 , 藤 入 相 
同 机 构 内 部 社会 网 络 的 作者 间 存 在 着 强 关 系 ,这 种 机 
构 内 部 的 学 术 合作 与 交流 具有 天 然 的 稳定 性 与 低 成 
本 ,而 出 现在 学 术 论 文中 的 引用 关系 指向 偏好 是 同 机 


构 作 者 非 正 式 交 流 的 显 性 体现 ;其 二 ,工作 在 相同 机 构 
的 作者 们 通常 具有 相同 或 相近 的 学 科 背 景 、, 知 识 结构 、 
制度 文化 ,心理 距离 等 ,这 些 可 能 的 相似 性 都 有 利于 引 
用 关系 产生 。 总 之 ,模型 拟 合 结果 很 好 地 支持 了 正式 
组 织 同 配 的 正 向 效应 ,因此 假设 3 成 立 。 

变量 Nodematch( 4U) 的 系数 为 负 , 但 没有 通过 显 
闭 性 检验 ,说 明 在 高 影响 力作 者 内 部 并 不 存在 更 显著 


要 呈 引用 的 现象 只 是 学 和 领域 整 体 中 的 部 分 ,局 部 的 
特 知 无 法 通过 本 文 模型 得 到 检验 ;需要 结合 实际 学 科 
领 囊 . 针 对 特定 群体 加 以 具体 分 析 。 基 于 此 ,实证 结果 
不 稻 支 持 假设 4 的 成 立 。 
O 〇 变量 Nodematch( CY) 系数 显著 为 负 , 说 明 国家 层 
十 的 文献 异 配 促进 了 引用 关系 的 建立 。 具 体 地 ,假定 
避 旦 网 络 其 他 条 件 不 变 ,来 源 于 不 同 国家 的 科学 文献 
7 后 引用 关系 的 几率 是 相同 国家 的 2.344( = er ) 
倍 e 模 型 拟 合 结果 说 明 引用 更 倾向 于 在 不 同 国家 文献 
之 闻 产 生 , 这 与 研究 假设 预期 不 同 。 值 得 注意 的 是 , 虽 
然 樟 型 拟 合 结果 否定 了 国家 层面 的 文献 同 配 效应 ,但 
是 在 前 述 描述 性 分 析 中 也 发 现在 少数 国家 中 呈现 出 的 
同 配 趋势 ,例如 表 2、 表 3 的 分 析 都 说 明 以 美国 为 代表 
的 几 个 国家 具有 非常 高 的 引文 吸引 力 , 这 些 国家 的 学 
科 文献 不 但 内 部 互 引 率 很 高 ,而 且 也 成 为 其 他 大 部 分 


献 学 术 水 平 每 增加 1 个 单位 ,其 被 引用 的 几率 提高 
1.066 倍 。 估 计 结果 说 明文 献 学 术 价值 越 高 越 有 有 助 
于 增加 新 的 被 引 关系 ,学 术 价值 在 引用 关系 形成 过 程 
中 发 挥 正 向 影响 ,符合 对 于 引文 价值 指向 的 基本 认 知 
与 预期 。 


4 结论 


本 文 针 对 施 引 文献 与 被 引文 献 之 间 的 相似 性 倾 
向 ,采用 指数 随机 图 模型 ,以 图 书馆 与 情报 学 领域 为 对 
象 ,开展 实证 研究 。 研 究 发 现 :中 整体 上 ,文献 相似 现 
象 在 引用 关系 中 具有 普遍 性 和 多 种 表现 形式 ,三 角 结 
构 趋 同 .期 刊 同 配 、 机 构 同 配对 引用 关系 具有 促进 效 
应 ;@ 深 入 分 析 发 现 文献 相似 倾向 也 表现 出 复杂 性 , 例 
如 在 整个 样本 中 ,引用 文献 呈现 出 国家 蜡 配 特征 ,但 如 
果 仅 考虑 占据 学 科 优 势 国家 的 部 分 样本 , 则 呈现 出 了 
文献 间 的 国家 同 配 倾向 。 

通过 实证 结果 可 以 得 到 以 下 启示 : 

(1) 社 会 接近 性 是 引用 关系 的 重要 形成 机 制 。 相 
似 文献 表现 出 的 引用 偏好 某 种 程度 上 也 是 社会 接近 性 
的 体现 。 从 信息 搜索 的 角度 看 ,相似 的 文献 在 搜索 和 
辨别 的 机 会 成 本 上 具有 优势 。 面 对 海量 的 文献 .复杂 
的 学 术 问 题 ,不 论 在 哪个 层面 的 社会 接近 性 都 为 规避 
误 判 风险 .避免 学 术 偏差 提供 了 高 效率 、 低 成 本 的 方案 
指引 ,作者 在 时 间 、 精 力 ,学 识 的 约束 条 件 下 ,可 能 更 愿 
意 去 相信 和 选择 社会 距离 近 的 文献 。 从 社会 接近 性 的 
视角 不 但 能 够 给 文献 相似 现象 给 予 较 好 解释 ,更 丰富 
了 引用 形成 机 制 的 理解 。 

(2) 伴 随 引 用 关系 的 文献 相似 是 个 体 智 力 创造 与 
群体 社会 因素 交织 的 结果 。 引 用 本 质 上 是 一 种 特定 的 
关系 ,是 要 素 相 互 影响 和 交互 的 结果 ,例如 观点 的 继承 
与 碰撞 、 学 术 规 范 惯例 的 约束 、 作 者 间 影 响 力 展现 .组 
织 机构 内 强 关 系 的 延伸 、 地 理 空间 的 知识 溢出 效应 . 语 


学 科 水 平 相对 落后 国家 的 文献 引用 目标 。 在 国家 层 
面 , 科 学 研究 存在 着 显著 的 马 太 效 应 ” ,少数 国家 成 
为 学 科 的 核心 与 权威 ,引用 从 其 他 外 围 国家 向 核心 国 
家 聚集 。 个 别 高 影响 力 国家 成 为 引用 网 络 的 吸引 奇 
点 ,不 但 吸引 低 影 响 力 国家 文献 的 引用 ,而 且 自 身 内 部 
也 存在 高 比例 自 引 ,引用 沿 着 国家 影响 力 分 布 的 梯度 
方向 流动 。 结 合 两 方面 分 析 , 可 以 得 出 在 整体 上 引用 
呈现 出 国家 异 配 效应 ,而 个 别 学 科 领 先 国 家 文献 则 呈 
现 出 一 定 程度 的 同 配 性 。 基 于 以 上 ,实证 结果 部 分 支 
持 假 设 5 成 立 。 

作为 控制 变量 ,Nodeicov( CT) 的 系数 显著 为 正 , 文 
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言 文化 的 兼容 和 惯性 。 各 种 要 素 群 体 交 互 形成 的 影响 
力 不 仅 难以 忽略 ,甚至 可 能 超出 了 通常 的 预期 ,例如 文 
献 机 构 同 配 性 所 表现 出 的 显著 而 强烈 效应 。 虽 然 结 论 
建立 在 特定 学 科 样 本 之 上 ,但 亦 充分 反映 出 学 术 创 作 
过 程 不 单 是 逻辑 .观点 交互 磁 撞 的 思维 活动 ,更 是 作者 
所 般 入 社会 网 络 环境 的 综合 作用 结果 ,而 网 络 强 关系 
产生 的 影响 尤为 重要 。 需 要 结合 以 科学 社会 学 思想 为 
代表 的 规范 理论 与 社会 建构 理论 加 以 解释 。 

(3 ) 网络 般 入 视角 可 能 更 有 利于 揭示 引用 行为 的 
复杂 性 。 引 用 行为 具有 复杂 的 动机 ,而 引用 关系 之 间 
存在 的 相关 性 某 种 程度 上 正 是 复杂 性 的 体现 ,这 一 点 


段 庆 笑 ， 
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潘 小 换 . 文献 相似 性 对 科学 引用 偏好 的 影响 实证 研究 [J]. 图 书 情报 工作 ,2018 ,62(4) :97 - 106. 


也 通常 被 多 数 文献 所 忽视 。 引 用 关系 在 网 络 中 涌现 出 
吉 构 租 入 特征 体现 了 引用 行为 中 作者 群体 的 交互 影 
响 , 实 证 研究 也 充分 说 明了 引用 关系 倾向 于 租 和 三角 
结构 的 事实 。 社 会 网 络 和 复杂 网 络 理论 为 网 络 庶 入 视 
角 的 分 析 提 供 了 指导 ,而 且 随 着 大 数据 技术 的 日 益 成 
熟 ,建立 在 大 数据 基础 上 的 网 络 建 模 会 是 未 来 深入 揭 
示 引 用 本 质 的 有 效 途 径 。 

因此 ,引文 指标 所 测度 的 不 仅仅 是 学 术 价 值 ,更 准 
确 地 讲 是 文献 的 综合 影响 力 , 是 多 种 隐 性 要 素 影 响 的 
结果 ,非常 有 必要 以 客观 谨慎 的 态度 对 待 引文 指标 的 
适用 和 和 解释。 另外 ,需要 说 明 的 是 本 文 聚焦 于 社会 层 
面 的 文献 相似 ,未 涉及 文献 主题 或 内 容 上 的 相似 ,可 以 
扩展 研究 思路 ,将 两 个 层面 的 相似 性 纳入 同一 研究 框 
se 过 程 中 的 社会 建构 .学术 规范 之 间 的 
。 ee 
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ye 
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Abstract: [Purpose/significance | It is possible to understand the mechanism of citation more deeply and clearly, 


understanding the nature of phenomenon in similarity between citing document and cited document which share the same or 


similar features. [ Method/ process | Aiming to discover the extent to which similarity between documents existing citation 
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relationship affects the preference of citations, empirical research was conducted to focus on the academic field of LIS by 
the statistical method of Exponential Random Graph Models (ERGM). [Result/conclusion ] Some empirical results were 
found as following that there obviously exists tendency to be similarity between documents in the aspects of embedded net- 
work structure, affiliation and journal. Specially ，the dyadic citation relation would be more likely to be embedded in the 
triangle transmit structure in citation network, and happened between the documents with the same affiliation and journal. 
Moreover, the documents, from the countries which are domain in the specific academic field would be more likely to 
form the relationship of citation. Consequently, the empirical results adequately imply that social affinity is the crucial 
mechanism for citation behavior and reflect the social feature of citation preference. 


Keywords: documents similarity scientific citation ERGM 
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